home *** CD-ROM | disk | FTP | other *** search
/ Australian Personal Computer 2002 November / CD 1 / APC0211D1.ISO / workshop / prog / files / ActivePerl-5.6.1.633-MSWin32.msi / _f3bfe19c6a87e8f476745dc98452c4ee < prev    next >
Encoding:
Text File  |  2002-05-01  |  18.2 KB  |  616 lines

  1. package HTTP::Headers;
  2.  
  3. # $Id: Headers.pm,v 1.43 2001/11/15 06:19:22 gisle Exp $
  4.  
  5. =head1 NAME
  6.  
  7. HTTP::Headers - Class encapsulating HTTP Message headers
  8.  
  9. =head1 SYNOPSIS
  10.  
  11.  require HTTP::Headers;
  12.  $h = HTTP::Headers->new;
  13.  
  14.  $h->header('Content-Type' => 'text/plain');  # set
  15.  $ct = $h->header('Content-Type');            # get
  16.  $h->remove_header('Content-Type');           # delete
  17.  
  18. =head1 DESCRIPTION
  19.  
  20. The C<HTTP::Headers> class encapsulates HTTP-style message headers.
  21. The headers consist of attribute-value pairs also called fields, which
  22. may be repeated, and which are printed in a particular order.
  23.  
  24. Instances of this class are usually created as member variables of the
  25. C<HTTP::Request> and C<HTTP::Response> classes, internal to the
  26. library.
  27.  
  28. The following methods are available:
  29.  
  30. =over 4
  31.  
  32. =cut
  33.  
  34. use strict;
  35. use Carp ();
  36.  
  37. use vars qw($VERSION $TRANSLATE_UNDERSCORE);
  38. $VERSION = sprintf("%d.%02d", q$Revision: 1.43 $ =~ /(\d+)\.(\d+)/);
  39.  
  40. # The $TRANSLATE_UNDERSCORE variable controls whether '_' can be used
  41. # as a replacement for '-' in header field names.
  42. $TRANSLATE_UNDERSCORE = 1 unless defined $TRANSLATE_UNDERSCORE;
  43.  
  44. # "Good Practice" order of HTTP message headers:
  45. #    - General-Headers
  46. #    - Request-Headers
  47. #    - Response-Headers
  48. #    - Entity-Headers
  49.  
  50. my @header_order = qw(
  51.    Cache-Control Connection Date Pragma Trailer Transfer-Encoding Upgrade
  52.    Via Warning
  53.  
  54.    Accept Accept-Charset Accept-Encoding Accept-Language
  55.    Authorization Expect From Host
  56.    If-Match If-Modified-Since If-None-Match If-Range If-Unmodified-Since
  57.    Max-Forwards Proxy-Authorization Range Referer TE User-Agent
  58.  
  59.    Accept-Ranges Age ETag Location Proxy-Authenticate Retry-After Server
  60.    Vary WWW-Authenticate
  61.  
  62.    Allow Content-Encoding Content-Language Content-Length Content-Location
  63.    Content-MD5 Content-Range Content-Type Expires Last-Modified
  64. );
  65.  
  66. # Make alternative representations of @header_order.  This is used
  67. # for sorting and case matching.
  68. my %header_order;
  69. my %standard_case;
  70.  
  71. {
  72.     my $i = 0;
  73.     for (@header_order) {
  74.     my $lc = lc $_;
  75.     $header_order{$lc} = ++$i;
  76.     $standard_case{$lc} = $_;
  77.     }
  78. }
  79.  
  80.  
  81.  
  82.  
  83. =item $h = HTTP::Headers->new
  84.  
  85. Constructs a new C<HTTP::Headers> object.  You might pass some initial
  86. attribute-value pairs as parameters to the constructor.  I<E.g.>:
  87.  
  88.  $h = HTTP::Headers->new(
  89.        Date         => 'Thu, 03 Feb 1994 00:00:00 GMT',
  90.        Content_Type => 'text/html; version=3.2',
  91.        Content_Base => 'http://www.perl.org/');
  92.  
  93. The constructor arguments are passed to the C<header> method which is
  94. described below.
  95.  
  96. =cut
  97.  
  98. sub new
  99. {
  100.     my($class) = shift;
  101.     my $self = bless {}, $class;
  102.     $self->header(@_); # set up initial headers
  103.     $self;
  104. }
  105.  
  106.  
  107. =item $h->header($field [=> $value],...)
  108.  
  109. Get or set the value of one or more header fields.  The header field name
  110. ($field) is not case sensitive.  To make the life easier for perl
  111. users who wants to avoid quoting before the => operator, you can use
  112. '_' as a replacement for '-' in header names (this behaviour can be
  113. suppressed by setting the $HTTP::Headers::TRANSLATE_UNDERSCORE
  114. variable to a FALSE value).
  115.  
  116. The header() method accepts multiple ($field => $value) pairs, which
  117. means that you can update several fields with a single invocation.
  118.  
  119. The $value argument may be a plain string or a reference to an array
  120. of strings for a multi-valued field. If the $value is undefined or not
  121. given, then that header field will remain unchanged.
  122.  
  123. The old value (or values) of the last of the header fields is returned.
  124. If no such field exists C<undef> will be returned.
  125.  
  126. A multi-valued field will be retuned as separate values in list
  127. context and will be concatenated with ", " as separator in scalar
  128. context.  The HTTP spec (RFC 2616) promise that joining multiple
  129. values in this way will not change the semantic of a header field, but
  130. in practice there are cases like old-style Netscape cookies (see
  131. L<HTTP::Cookies>) where "," is used as part of the syntax of a single
  132. field value.
  133.  
  134. Examples:
  135.  
  136.  $header->header(MIME_Version => '1.0',
  137.          User_Agent   => 'My-Web-Client/0.01');
  138.  $header->header(Accept => "text/html, text/plain, image/*");
  139.  $header->header(Accept => [qw(text/html text/plain image/*)]);
  140.  @accepts = $header->header('Accept');  # get multiple values
  141.  $accepts = $header->header('Accept');  # get values as a single string
  142.  
  143. =cut
  144.  
  145. sub header
  146. {
  147.     my $self = shift;
  148.     my(@old);
  149.     while (my($field, $val) = splice(@_, 0, 2)) {
  150.     @old = $self->_header($field, $val);
  151.     }
  152.     return @old if wantarray;
  153.     return $old[0] if @old <= 1;
  154.     join(", ", @old);
  155. }
  156.  
  157.  
  158. =item $h->push_header($field, $value)
  159.  
  160. Add a new field value for the specified header field.  Previous values
  161. for the same field are retained.
  162.  
  163. As for the header() method, the field name ($field) is not case
  164. sensitive and '_' can be used as a replacement for '-'.
  165.  
  166. The $value argument may be a scalar or a reference to a list of
  167. scalars.
  168.  
  169.  $header->push_header(Accept => 'image/jpeg');
  170.  $header->push_header(Accept => [map "image/$_", qw(gif png tiff)]);
  171.  
  172. =cut
  173.  
  174. sub push_header
  175. {
  176.     Carp::croak('Usage: $h->push_header($field, $val)') if @_ != 3;
  177.     shift->_header(@_, 'PUSH');
  178. }
  179.  
  180. =item $h->init_header($field, $value)
  181.  
  182. Set the specified header to the given value, but only if no previous
  183. value for that field is set.
  184.  
  185. The header field name ($field) is not case sensitive and '_'
  186. can be used as a replacement for '-'.
  187.  
  188. The $value argument may be a scalar or a reference to a list of
  189. scalars.
  190.  
  191. =cut
  192.  
  193. sub init_header
  194. {
  195.     Carp::croak('Usage: $h->init_header($field, $val)') if @_ != 3;
  196.     shift->_header(@_, 'INIT');
  197. }
  198.  
  199.  
  200. =item $h->remove_header($field,...)
  201.  
  202. This function removes the headers fields with the specified names.
  203.  
  204. The header field names ($field) are not case sensitive and '_'
  205. can be used as a replacement for '-'.
  206.  
  207. The return value is the values of the fields removed.  In scalar
  208. context the number of fields removed is returned.
  209.  
  210. Note that if you pass in multiple field names then it is generally not
  211. possible to tell which of the returned values belonged to which field.
  212.  
  213. =cut
  214.  
  215. sub remove_header
  216. {
  217.     my($self, @fields) = @_;
  218.     my $field;
  219.     my @values;
  220.     foreach $field (@fields) {
  221.     $field =~ tr/_/-/ if $TRANSLATE_UNDERSCORE;
  222.     my $v = delete $self->{lc $field};
  223.     push(@values, ref($v) ? @$v : $v) if defined $v;
  224.     }
  225.     return @values;
  226. }
  227.  
  228.  
  229. sub _header
  230. {
  231.     my($self, $field, $val, $op) = @_;
  232.     $field =~ tr/_/-/ if $TRANSLATE_UNDERSCORE;
  233.  
  234.     # $push is only used interally sub push_header
  235.     Carp::croak('Need a field name') unless length($field);
  236.  
  237.     my $lc_field = lc $field;
  238.     unless(defined $standard_case{$lc_field}) {
  239.     # generate a %standard_case entry for this field
  240.     $field =~ s/\b(\w)/\u$1/g;
  241.     $standard_case{$lc_field} = $field;
  242.     }
  243.  
  244.     my $h = $self->{$lc_field};
  245.     my @old = ref($h) ? @$h : (defined($h) ? ($h) : ());
  246.  
  247.     $op ||= "";
  248.     $val = undef if $op eq 'INIT' && @old;
  249.     if (defined($val)) {
  250.     my @new = ($op eq 'PUSH') ? @old : ();
  251.     if (!ref($val)) {
  252.         push(@new, $val);
  253.     } elsif (ref($val) eq 'ARRAY') {
  254.         push(@new, @$val);
  255.     } else {
  256.         Carp::croak("Unexpected field value $val");
  257.     }
  258.     $self->{$lc_field} = @new > 1 ? \@new : $new[0];
  259.     }
  260.     @old;
  261. }
  262.  
  263.  
  264. # Compare function which makes it easy to sort headers in the
  265. # recommended "Good Practice" order.
  266. sub _header_cmp
  267. {
  268.     ($header_order{$a} || 999) <=> ($header_order{$b} || 999) || $a cmp $b;
  269. }
  270.  
  271.  
  272. =item $h->scan(\&doit)
  273.  
  274. Apply a subroutine to each header field in turn.  The callback routine
  275. is called with two parameters; the name of the field and a single
  276. value (a string).  If a header field is multi-valued, then the
  277. routine is called once for each value.  The field name passed to the
  278. callback routine has case as suggested by HTTP spec, and the headers
  279. will be visited in the recommended "Good Practice" order.
  280.  
  281. Any return values of the callback routine are ignored.  The loop can
  282. be broken by raising an exception (C<die>).
  283.  
  284. =cut
  285.  
  286. sub scan
  287. {
  288.     my($self, $sub) = @_;
  289.     my $key;
  290.     foreach $key (sort _header_cmp keys %$self) {
  291.         next if $key =~ /^_/;
  292.     my $vals = $self->{$key};
  293.     if (ref($vals)) {
  294.         my $val;
  295.         for $val (@$vals) {
  296.         &$sub($standard_case{$key} || $key, $val);
  297.         }
  298.     } else {
  299.         &$sub($standard_case{$key} || $key, $vals);
  300.     }
  301.     }
  302. }
  303.  
  304.  
  305. =item $h->as_string([$endl])
  306.  
  307. Return the header fields as a formatted MIME header.  Since it
  308. internally uses the C<scan> method to build the string, the result
  309. will use case as suggested by HTTP spec, and it will follow
  310. recommended "Good Practice" of ordering the header fieds.  Long header
  311. values are not folded.
  312.  
  313. The optional $endl parameter specifies the line ending sequence to
  314. use.  The default is "\n".  Embedded "\n" characters in header field
  315. values will be substitued with this line ending sequence.
  316.  
  317. =cut
  318.  
  319. sub as_string
  320. {
  321.     my($self, $endl) = @_;
  322.     $endl = "\n" unless defined $endl;
  323.  
  324.     my @result = ();
  325.     $self->scan(sub {
  326.     my($field, $val) = @_;
  327.     if ($val =~ /\n/) {
  328.         # must handle header values with embedded newlines with care
  329.         $val =~ s/\s+$//;          # trailing newlines and space must go
  330.         $val =~ s/\n\n+/\n/g;      # no empty lines
  331.         $val =~ s/\n([^\040\t])/\n $1/g;  # intial space for continuation
  332.         $val =~ s/\n/$endl/g;      # substitute with requested line ending
  333.     }
  334.     push(@result, "$field: $val");
  335.     });
  336.  
  337.     join($endl, @result, '');
  338. }
  339.  
  340.  
  341. =item $h->clone
  342.  
  343. Returns a copy of this C<HTTP::Headers> object.
  344.  
  345. =back
  346.  
  347. =cut
  348.  
  349. sub clone
  350. {
  351.     my $self = shift;
  352.     my $clone = new HTTP::Headers;
  353.     $self->scan(sub { $clone->push_header(@_);} );
  354.     $clone;
  355. }
  356.  
  357.  
  358. =head1 CONVENIENCE METHODS
  359.  
  360. The most frequently used headers can also be accessed through the
  361. following convenience methods.  These methods can both be used to read
  362. and to set the value of a header.  The header value is set if you pass
  363. an argument to the method.  The old header value is always returned.
  364. If the given header did not exists then C<undef> is returned.
  365.  
  366. Methods that deal with dates/times always convert their value to system
  367. time (seconds since Jan 1, 1970) and they also expect this kind of
  368. value when the header value is set.
  369.  
  370. =over 4
  371.  
  372. =item $h->date
  373.  
  374. This header represents the date and time at which the message was
  375. originated. I<E.g.>:
  376.  
  377.   $h->date(time);  # set current date
  378.  
  379. =item $h->expires
  380.  
  381. This header gives the date and time after which the entity should be
  382. considered stale.
  383.  
  384. =item $h->if_modified_since
  385.  
  386. =item $h->if_unmodified_since
  387.  
  388. These header fields are used to make a request conditional.  If the requested
  389. resource has (or has not) been modified since the time specified in this field,
  390. then the server will return a C<304 Not Modified> response instead of
  391. the document itself.
  392.  
  393. =item $h->last_modified
  394.  
  395. This header indicates the date and time at which the resource was last
  396. modified. I<E.g.>:
  397.  
  398.   # check if document is more than 1 hour old
  399.   if (my $last_mod = $h->last_modified) {
  400.       if ($last_mod < time - 60*60) {
  401.       ...
  402.       }
  403.   }
  404.  
  405. =item $h->content_type
  406.  
  407. The Content-Type header field indicates the media type of the message
  408. content. I<E.g.>:
  409.  
  410.   $h->content_type('text/html');
  411.  
  412. The value returned will be converted to lower case, and potential
  413. parameters will be chopped off and returned as a separate value if in
  414. an array context.  This makes it safe to do the following:
  415.  
  416.   if ($h->content_type eq 'text/html') {
  417.      # we enter this place even if the real header value happens to
  418.      # be 'TEXT/HTML; version=3.0'
  419.      ...
  420.   }
  421.  
  422. =item $h->content_encoding
  423.  
  424. The Content-Encoding header field is used as a modifier to the
  425. media type.  When present, its value indicates what additional
  426. encoding mechanism has been applied to the resource.
  427.  
  428. =item $h->content_length
  429.  
  430. A decimal number indicating the size in bytes of the message content.
  431.  
  432. =item $h->content_language
  433.  
  434. The natural language(s) of the intended audience for the message
  435. content.  The value is one or more language tags as defined by RFC
  436. 1766.  Eg. "no" for some kind of Norwegian and "en-US" for English the
  437. way it is written in the US.
  438.  
  439. =item $h->title
  440.  
  441. The title of the document.  In libwww-perl this header will be
  442. initialized automatically from the E<lt>TITLE>...E<lt>/TITLE> element
  443. of HTML documents.  I<This header is no longer part of the HTTP
  444. standard.>
  445.  
  446. =item $h->user_agent
  447.  
  448. This header field is used in request messages and contains information
  449. about the user agent originating the request.  I<E.g.>:
  450.  
  451.   $h->user_agent('Mozilla/1.2');
  452.  
  453. =item $h->server
  454.  
  455. The server header field contains information about the software being
  456. used by the originating server program handling the request.
  457.  
  458. =item $h->from
  459.  
  460. This header should contain an Internet e-mail address for the human
  461. user who controls the requesting user agent.  The address should be
  462. machine-usable, as defined by RFC822.  E.g.:
  463.  
  464.   $h->from('King Kong <king@kong.com>');
  465.  
  466. I<This header is no longer part of the HTTP standard.>
  467.  
  468. =item $h->referer
  469.  
  470. Used to specify the address (URI) of the document from which the
  471. requested resouce address was obtained.
  472.  
  473. The "Free On-line Dictionary of Computing" as this to say about the
  474. word I<referer>:
  475.  
  476.      <World-Wide Web> A misspelling of "referrer" which
  477.      somehow made it into the {HTTP} standard.  A given {web
  478.      page}'s referer (sic) is the {URL} of whatever web page
  479.      contains the link that the user followed to the current
  480.      page.  Most browsers pass this information as part of a
  481.      request.
  482.  
  483.      (1998-10-19)
  484.  
  485. By popular demand C<referrer> exists as an alias for this method so you
  486. can avoid this misspelling in your programs and still send the right
  487. thing on the wire.
  488.  
  489.  
  490. =item $h->www_authenticate
  491.  
  492. This header must be included as part of a C<401 Unauthorized> response.
  493. The field value consist of a challenge that indicates the
  494. authentication scheme and parameters applicable to the requested URI.
  495.  
  496. =item $h->proxy_authenticate
  497.  
  498. This header must be included in a C<407 Proxy Authentication Required>
  499. response.
  500.  
  501. =item $h->authorization
  502.  
  503. =item $h->proxy_authorization
  504.  
  505. A user agent that wishes to authenticate itself with a server or a
  506. proxy, may do so by including these headers.
  507.  
  508. =item $h->authorization_basic
  509.  
  510. This method is used to get or set an authorization header that use the
  511. "Basic Authentication Scheme".  In array context it will return two
  512. values; the user name and the password.  In scalar context it will
  513. return I<"uname:password"> as a single string value.
  514.  
  515. When used to set the header value, it expects two arguments.  I<E.g.>:
  516.  
  517.   $h->authorization_basic($uname, $password);
  518.  
  519. The method will croak if the $uname contains a colon ':'.
  520.  
  521. =item $h->proxy_authorization_basic
  522.  
  523. Same as authorization_basic() but will set the "Proxy-Authorization"
  524. header instead.
  525.  
  526. =back
  527.  
  528. =cut
  529.  
  530. sub _date_header
  531. {
  532.     require HTTP::Date;
  533.     my($self, $header, $time) = @_;
  534.     my($old) = $self->_header($header);
  535.     if (defined $time) {
  536.     $self->_header($header, HTTP::Date::time2str($time));
  537.     }
  538.     HTTP::Date::str2time($old);
  539. }
  540.  
  541. sub date                { shift->_date_header('Date',                @_); }
  542. sub expires             { shift->_date_header('Expires',             @_); }
  543. sub if_modified_since   { shift->_date_header('If-Modified-Since',   @_); }
  544. sub if_unmodified_since { shift->_date_header('If-Unmodified-Since', @_); }
  545. sub last_modified       { shift->_date_header('Last-Modified',       @_); }
  546.  
  547. # This is used as a private LWP extention.  The Client-Date header is
  548. # added as a timestamp to a response when it has been received.
  549. sub client_date         { shift->_date_header('Client-Date',         @_); }
  550.  
  551. # The retry_after field is dual format (can also be a expressed as
  552. # number of seconds from now), so we don't provide an easy way to
  553. # access it until we have know how both these interfaces can be
  554. # addressed.  One possibility is to return a negative value for
  555. # relative seconds and a positive value for epoch based time values.
  556. #sub retry_after       { shift->_date_header('Retry-After',       @_); }
  557.  
  558. sub content_type      {
  559.   my $ct = (shift->_header('Content-Type', @_))[0];
  560.   return '' unless defined($ct) && length($ct);
  561.   my @ct = split(/\s*;\s*/, lc($ct));
  562.   wantarray ? @ct : $ct[0];
  563. }
  564.  
  565. sub title             { (shift->_header('Title',            @_))[0] }
  566. sub content_encoding  { (shift->_header('Content-Encoding', @_))[0] }
  567. sub content_language  { (shift->_header('Content-Language', @_))[0] }
  568. sub content_length    { (shift->_header('Content-Length',   @_))[0] }
  569.  
  570. sub user_agent        { (shift->_header('User-Agent',       @_))[0] }
  571. sub server            { (shift->_header('Server',           @_))[0] }
  572.  
  573. sub from              { (shift->_header('From',             @_))[0] }
  574. sub referer           { (shift->_header('Referer',          @_))[0] }
  575. *referrer = \&referer;  # on tchrist's request
  576. sub warning           { (shift->_header('Warning',          @_))[0] }
  577.  
  578. sub www_authenticate  { (shift->_header('WWW-Authenticate', @_))[0] }
  579. sub authorization     { (shift->_header('Authorization',    @_))[0] }
  580.  
  581. sub proxy_authenticate  { (shift->_header('Proxy-Authenticate',  @_))[0] }
  582. sub proxy_authorization { (shift->_header('Proxy-Authorization', @_))[0] }
  583.  
  584. sub authorization_basic       { shift->_basic_auth("Authorization",       @_) }
  585. sub proxy_authorization_basic { shift->_basic_auth("Proxy-Authorization", @_) }
  586.  
  587. sub _basic_auth {
  588.     require MIME::Base64;
  589.     my($self, $h, $user, $passwd) = @_;
  590.     my($old) = $self->_header($h);
  591.     if (defined $user) {
  592.     Carp::croak("Basic authorization user name can't contain ':'")
  593.       if $user =~ /:/;
  594.     $passwd = '' unless defined $passwd;
  595.     $self->_header($h => 'Basic ' .
  596.                              MIME::Base64::encode("$user:$passwd", ''));
  597.     }
  598.     if (defined $old && $old =~ s/^\s*Basic\s+//) {
  599.     my $val = MIME::Base64::decode($old);
  600.     return $val unless wantarray;
  601.     return split(/:/, $val, 2);
  602.     }
  603.     return;
  604. }
  605.  
  606. =head1 COPYRIGHT
  607.  
  608. Copyright 1995-2001 Gisle Aas.
  609.  
  610. This library is free software; you can redistribute it and/or
  611. modify it under the same terms as Perl itself.
  612.  
  613. =cut
  614.  
  615. 1;
  616.